4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化 关键词: AI,Llama 7B,Meta,LLM,RLHF,DPO,模型训练 Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。 来自主题: AI技术研报 8015 点击 2024-07-31 16:05
Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑 关键词: Stability AI,Stable Code 3B,Llama,Code Llama 7B 今天,Stability AI发布了Stable Code 3B,在图片生成之外的战场上,Stability也开始发力了 来自主题: AI资讯 5660 点击 2024-01-17 13:46